Pandas有哪几种数据类型?

您所在的位置:网站首页 pandas 数据导入 Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

2022-06-13 12:27| 来源: 网络整理| 查看: 265

在我看来,对于Numpy以及Matplotlib,Pandas可以帮助创建一个非常牢固的用于数据挖掘与分析的基础。而Scipy(会在接下来的帖子中提及)当然是另一个主要的也十分出色的科学计算库,但是我认为前三者才是真正的Python科学计算的支柱。

所以,不需要太多精力,让我们马上开始Python科学计算系列的第三帖——Pandas。

导入Pandas

我们首先要导入我们的演出明星——Pandas。

Pandas有哪几种数据类型?

Pandas的数据类型

Pandas基于两种数据类型:series与dataframe。

一个series是一个一维的数据类型,其中每一个元素都有一个标签。如果你阅读过这个系列的关于Numpy的文章,你就可以发现series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。

一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。

将数据导入Pandas

在我们开始挖掘与分析之前,我们首先需要导入能够处理的数据。幸好,Pandas在这一点要比Numpy更方便。

在这里我推荐你使用自己所感兴趣的数据集来使用。你的或其他国家的政府网站上会有一些好的数据源。例如,你可以搜索英国政府数据或美国政府数据来获取数据源。当然,Kaggle是另一个好用的数据源。

在此,我将采用英国政府数据中关于降雨量数据,因为他们十分易于下载。此外,我还下载了一些日本降雨量的数据来使用。

Pandas有哪几种数据类型?

将你的数据准备好以进行挖掘和分析

现在我们已经将数据导入了Pandas。在我们开始深入探究这些数据之前,我们一定迫切地想大致浏览一下它们,并从中获得一些有用信息,帮助我们确立探究的方向。

想要快速查看前x行数据:

Pandas有哪几种数据类型?

你将获得一个类似下图一样的表:

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

你将获得类似下图的表

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

你将获得同之前一样的数据,但是列名已经变了:

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

此外,你可能需要知道你数据的一些基本的统计信息。Pandas让这件事变得非常简单。

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

过滤

当你查看你的数据集时,你可能希望获得一个特殊的样本数据。例如,如果你有一个关于工作满意度的问卷调查数据,你可能想要获得所有在同一行业或同一年龄段的人的数据。

Pandas为我们提供了多种方法来过滤我们的数据并提取出我们想要的信息。有时候你想要提取一整列。可以直接使用列标签,非常容易。

Pandas有哪几种数据类型?

还记得我所说的命名列标签的注意事项吗?不使用空格和横线等可以让我们以访问类属性相同的方法来访问列,即使用点运算符。

Pandas有哪几种数据类型?

如果你读过这一系列中Numpy那一篇帖子,你可能会记得一项技术叫做‘boolean masking’,即我们可以在数组上运行一个条件语句来获得对应的布尔值数组。好,我们也可以在Pandas中做同样的事。

Pandas有哪几种数据类型?

我们也可以使用这些条件表达式来过滤一个已知的dataframe。

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

值得注意的是,由于操作符优先级的问题,在这里你不可以使用关键字‘and’,而只能使用’&’与括号

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

索引

前几部分为我们展示了如何通过列操作来获得数据。实际上,Pandas同样有标签化的行操作。这些行标签可以是数字或是其他标签。获取行数据的方法也取决于这些标签的类型。

如果你的行有数字索引,你可以使用iloc引用他们:

Pandas有哪几种数据类型?

可能在你的数据集里有年份的列,或者年代的列,并且你希望可以用这些年份或年代来索引某些行。这样,我们可以设置一个(或多个)新的索引。

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

ix是另一个常用的引用一行的方法。那么,如果loc是字符串标签的索引方法,iloc是数字标签的索引方法,那什么是ix呢?事实上,ix是一个字符串标签的索引方法,但是它同样支持数字标签索引作为它的备选。

Pandas有哪几种数据类型?

既然ix可以完成loc和iloc二者的工作,为什么还需要它们呢?最主要的原因是ix有一些轻微的不可预测性。还记得我说数字标签索引是ix的备选吗?数字标签可能会让ix做出一些奇怪的事情,例如将一个数字解释成一个位置。而loc和iloc则为你带来了安全的、可预测的、内心的宁静。然而必须指出的是,ix要比loc和iloc更快。

通常我们都希望索引是整齐有序地。我们可以在Pandas中通过调用sort_index来对dataframe实现排序。

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

对数据集应用函数

有时候你会想以某些方式改变或是操作你数据集中的数据。例如,如果你有一列年份的数据而你希望创建一个新的列显示这些年份所对应的年代。Pandas对此给出了两个非常有用的函数,apply和applymap。

Pandas有哪几种数据类型?

操作一个数据集结构

另一件经常会对dataframe所做的操作是为了让它们呈现出一种更便于使用的形式而对它们进行的重构。

首先,groupby:

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

合并数据集

有时候你有两个单独的数据集,它们直接互相关联,而你想要比较它们的差异或者合并它们。没问题,Pandas可以很容易实现:

Pandas有哪几种数据类型?

如下你可以看到,两个数据集在年份这一类上已经合并了。rain_jpn数据集仅仅包含年份以及降雨量。当我们以年份这一列进行合并时,仅仅’jpn_rainfall’这一列和我们UK雨量数据集的对应列进行了合并。

Pandas有哪几种数据类型?

采用Pandas快速绘制图表

Matplotlib很好用,但是想要画出一个中途下降的图表还是需要费一番功夫的。而有的时候你仅仅想要快速画出一个数据的大致走势来帮助你发掘搞清这些数据的意义。Pandas提供了plot函数满足你的需求:

Pandas有哪几种数据类型?

Pandas有哪几种数据类型?

存储你的数据集

在清理、重构以及挖掘完你的数据后,你通常会剩下一些非常重要有用的东西。你不仅应当保留下你的原始数据,也同样需要保存下你最新处理过的数据集。

Pandas有哪几种数据类型?

上述代码会将你的数据存入一个csv文件以备下次使用。

到此为止,我们简单介绍了Pandas。正如我之前说的,Pandas是非常好用的库,而我们仅仅是接触了一点皮毛。但是我希望通过我的介绍,你可以开始进行真正的数据清理与挖掘工作了。

像往常一样,我非常希望你能尽快开始尝试Pandas。找一两个你喜欢的数据集,开一瓶啤酒,坐下来,然后开始探索你的数据吧。这确实是唯一的熟悉Pandas以及其他这一系列文章中提到的库的方式。再加上你永远不知道的,你会找到一些你感兴趣的东西的。

原文标题:Python科学计算之Pandas

文章出处:【微信号:magedu-Linux,微信公众号:马哥Linux运维】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

扫一扫,分享给好友

复制链接分享 评论

发布评论请先 登录

相关推荐

Arduino Portenta X8上Python程序和Arduino程序之间的通信 随着互联网技术以及嵌入式技术(包括人工智能与边缘计算技术)的发展,我们正在创建一个万物互联的世界,这.... 的头像 Linux阅码场 发表于 06-13 11:57 • 36次 阅读 SeriesGuide在Android管理和观看电视节目 ./oschina_soft/SeriesGuide.zip 发表于 06-13 11:29 • 1次 阅读 SeriesGuide在Android管理和观看电视节目 PyVenvManage管理Python解释器的Pycharm插件 ./oschina_soft/PyVenvManage.zip 发表于 06-13 10:18 • 1次 阅读 PyVenvManage管理Python解释器的Pycharm插件 蘑菇车联“车路云一体化”系统级方案助于提升全局效率最优决策 自动驾驶技术有望提升出行安全性,但要想解决上述问题并不容易。单车智能仅依靠车端感知、计算设备等,存在.... 的头像 科技绿洲 发表于 06-13 09:58 • 203次 阅读 Prime BSI EXpress背照式sCMOS相机可满足各种工作需要 荷兰特文特大学科学技术学院 自适应量子光学实验室在量子信息科学与技术的应用方面开展了先进的量子光物理.... 的头像 科技绿洲 发表于 06-12 17:35 • 429次 阅读 Python中pyzxing安装与测试方法 Python中有几个开源的条码解析库,之前我测试过pyzbar、libdmx这些库,发现都是个锤子,.... 的头像 OpenCV学堂 发表于 06-12 16:50 • 140次 阅读 使用map函数实现Python程序并行化 Python 在程序并行化方面多少有些声名狼藉。撇开技术上的问题,例如线程的实现和 GIL,我觉得错.... 的头像 马哥Linux运维 发表于 06-12 16:31 • 185次 阅读 曙光ParaStor为全国数千家客户管理着数EB存储空间 作为数据生态系统最底层的存储系统,承担着数据安全地基的角色。纵观我国存储产业历程,以曙光为代表的本土.... 的头像 科技绿洲 发表于 06-12 15:45 • 248次 阅读 华芯携手北斗星通共同打造自动驾驶高精定位产品级解决方案 近期,华芯携手北斗星通旗下企业真点科技共创高精度定位生态,以厘米级定位精度赋能自动驾驶汽车。此次华芯.... 的头像 科技绿洲 发表于 06-12 15:21 • 289次 阅读 星环科技入选 “2021年重点课题研究优秀课题报告” 日前,中国证券业协会2021年重点课题研究优秀课题报告评选结果公示,星环科技联合银河证券申报的课题 .... 的头像 科技绿洲 发表于 06-10 17:29 • 316次 阅读 Young基于Python的开源论坛 ./oschina_soft/Young.zip 发表于 06-10 14:33 • 3次 阅读 Young基于Python的开源论坛 Retwis-py仿Twitter微博系统 ./oschina_soft/retwis-py.zip 发表于 06-10 14:31 • 15次 阅读 Retwis-py仿Twitter微博系统 ME@deepgully开源博客系统 ./oschina_soft/me.zip 发表于 06-10 14:20 • 5次 阅读 ME@deepgully开源博客系统 Tornado-Minos简约社区系统 ./oschina_soft/Minos.zip 发表于 06-10 11:32 • 5次 阅读 Tornado-Minos简约社区系统 reddit官方网站源代码 ./oschina_soft/reddit.zip 发表于 06-10 11:06 • 5次 阅读 reddit官方网站源代码 Misago开源Python论坛系统 ./oschina_soft/Misago.zip 发表于 06-10 11:05 • 3次 阅读 Misago开源Python论坛系统 3n1b三年一班开源论坛 ./oschina_soft/3n1b.com.zip 发表于 06-10 11:04 • 9次 阅读 3n1b三年一班开源论坛 ByrBbsMirror北邮人论坛镜像 ./oschina_soft/ByrBbsMirror.zip 发表于 06-10 10:37 • 5次 阅读 ByrBbsMirror北邮人论坛镜像 Icarus基于Python3.6和Vue.js的社区系统 ./oschina_soft/Icarus.zip 发表于 06-10 10:06 • 3次 阅读 Icarus基于Python3.6和Vue.js的社区系统 FakeV2EX基于Django的仿V2EX社区 ./oschina_soft/FakeV2EX.zip 发表于 06-10 09:57 • 5次 阅读 FakeV2EX基于Django的仿V2EX社区 Yat自动化测试框架 ./oschina_soft/gitee-Yat.zip 发表于 06-10 09:34 • 1次 阅读 Yat自动化测试框架 东软医疗NeuBrilliant卒中智能急救助手助力优质医疗服务 创新不止,关爱无界。东软医疗将继续以高端诊疗设备和智能软件的研发为基础,不断完善胸痛、卒中双中心建设.... 的头像 科技绿洲 发表于 06-09 17:51 • 519次 阅读 宇泛推出数智建造解决方案 赋能智慧城市建设 近日,由宇泛参与编制的《智慧工地总体规范》、《智慧工地建设规范》和《智慧工地应用规范》3项团体标准经.... 的头像 科技绿洲 发表于 06-09 17:07 • 733次 阅读 IBM提出开放混合云架构为客户机房节能减排提供数据支撑 随着各行各业数字化转型的不断深入,企业对技术支持服务的规模、技术复杂度、响应速度的要求日益严苛。而当.... 的头像 科技绿洲 发表于 06-09 15:36 • 291次 阅读 DeerU基于Django的开源博客系统 ./oschina_soft/gitee-DeerU.zip 发表于 06-09 14:45 • 13次 阅读 DeerU基于Django的开源博客系统 利用Django开发的写作系统变饼档博客 ./oschina_soft/gitee-bianbingdang.zip 发表于 06-09 14:37 • 8次 阅读 利用Django开发的写作系统变饼档博客 MyDjangoBlog基于Django搭建的个人博客 ./oschina_soft/gitee-17python.zip 发表于 06-09 14:23 • 8次 阅读 MyDjangoBlog基于Django搭建的个人博客 碎言静态博客系统 ./oschina_soft/gitee-suiyan.zip 发表于 06-09 11:21 • 10次 阅读 碎言静态博客系统 WLBLOG静态博客生成系统 ./oschina_soft/gitee-WLBLOG.zip 发表于 06-09 10:55 • 6次 阅读 WLBLOG静态博客生成系统 White博客CMS ./oschina_soft/white.zip 发表于 06-09 10:50 • 8次 阅读 White博客CMS PyLinden静态博客生成器 ./oschina_soft/PyLinden.zip 发表于 06-09 10:29 • 6次 阅读 PyLinden静态博客生成器 ijd8博客for BAE/SAE ./oschina_soft/ijd8.zip 发表于 06-09 10:28 • 9次 阅读 ijd8博客for BAE/SAE GarfieltBlog-webpy web.py轻量级博客系统 ./oschina_soft/GarfieltBlog-webpy.zip 发表于 06-09 10:24 • 6次 阅读 GarfieltBlog-webpy web.py轻量级博客系统 DPress博客系统 ./oschina_soft/DPress.zip 发表于 06-09 10:04 • 11次 阅读 DPress博客系统 MapleBlog博客平台 ./oschina_soft/MapleBlog.zip 发表于 06-09 09:20 • 9次 阅读 MapleBlog博客平台 大小鼠热板测痛仪操作流程的详细介绍  热板法是镇痛药物筛选、检测中常用的一种方法,也是一种能确定区分中 枢神经和末梢神经镇痛机理的方法,.... 的头像 ahyk 发表于 06-08 17:41 • 247次 阅读 大小鼠热板测痛仪操作流程的详细介绍 支持蓝牙双模的纯数据芯片KT6368A介绍 KT6368A芯片是一款支持蓝牙双模的纯数据芯片,蓝牙5.1版本。芯片的亮点在超小尺寸,超级价格。以.... 的头像 清月电子 发表于 06-08 16:18 • 316次 阅读 支持蓝牙双模的纯数据芯片KT6368A介绍 风光互补系统在地质灾害中的应用 2021年全国共发生地质灾害4772起,一共造成80人死亡、11人失踪、55人受伤,直接经济损失13.... 发表于 06-08 14:24 • 21次 阅读 如何为企业制定有效的数据质量政策   虽然数据质量框架有助于组织数据质量工作的运营方面,但数据质量情报让关键决策者和其他利益相关者深入.... 的头像 星星科技指导员 发表于 06-08 11:33 • 183次 阅读 IBM z16推出全新的容量订阅模式 今天,你用主机了吗?如果你刚刚用手机在网上买了东西,那么这笔购物交易的转账操作,极有可能就是在银行的.... 的头像 科技绿洲 发表于 06-08 10:45 • 271次 阅读 华为云桌面实现灵活云上办公、降本增效 近年来,各领域发布了数字化转型、数字经济和信息化的规划,推动软件及IT服务市场规模迅速扩大,不仅加速.... 的头像 科技绿洲 发表于 06-08 10:35 • 278次 阅读 subsync自动同步字幕和视频画面 ./oschina_soft/subsync.zip 发表于 06-07 15:06 • 11次 阅读 subsync自动同步字幕和视频画面 Pokemon-Terminal口袋妖怪主题终端 ./oschina_soft/Pokemon-Terminal.zip 发表于 06-07 14:48 • 9次 阅读 Pokemon-Terminal口袋妖怪主题终端 BlenderGIS链接Blender和地理数据的Blender插件 ./oschina_soft/BlenderGIS.zip 发表于 06-07 14:29 • 10次 阅读 BlenderGIS链接Blender和地理数据的Blender插件 QuickWall基于Python的壁纸更换软件 ./oschina_soft/QuickWall.zip 发表于 06-07 14:28 • 8次 阅读 QuickWall基于Python的壁纸更换软件 Interest.blog 基于Python Flask的技术博客 ./oschina_soft/interest.blog.zip 发表于 06-07 14:27 • 8次 阅读 Interest.blog 基于Python Flask的技术博客 中海达为防灾减灾救灾提供水文专业技术数据支撑 接到协助通知后,中海达四川分公司第一时间响应,一支由航测专员、海洋专员、技术人员组成的中海达应急队迅.... 的头像 科技绿洲 发表于 06-07 14:22 • 183次 阅读 arXiv2020-RIFE基于Python开发的视频插帧工具 ./oschina_soft/arXiv2020-RIFE.zip 发表于 06-07 14:17 • 11次 阅读 arXiv2020-RIFE基于Python开发的视频插帧工具 SemEval 2022: 多语种惯用语识别评测冠军系统简介 提交的系统使用XLM-RoBERTa作为编码器,在预处理过程中对训练数据的惯用语短语(MWE)进行特.... 的头像 深度学习自然语言处理 发表于 06-07 09:48 • 94次 阅读 启动数字化转型战略的初心是什么? 还是那句话,要牢记我们的初心。无论我们如何变革、如何转型,最终的目标是能更好地服务客户, 从而让企业.... 的头像 工业互联网前线 发表于 06-07 09:33 • 180次 阅读 【飞控开发基础教程6】疯壳·开源编队无人机-SPI(六轴传感器数据获取) COCOFLY教程——疯壳·无人机·系列SPI(六轴传感器数据获取)             &nb... 发表于 05-30 11:19 • 1510次 阅读 【飞控开发基础教程6】疯壳·开源编队无人机-SPI(六轴传感器数据获取) python学习框架介绍 对于爬虫初学者来说,弄清楚一个领域的知识体系往往比单纯学习某个技术要重要得多,因为技术总会跟随时代发生快速变化,而知识... 发表于 05-25 16:47 • 3804次 阅读 【开源分享】树莓PICO掌上电脑的通用Python教程 作者:Peter Misenko 树莓PICO掌上电脑的通用Python教程 我注意尽量减少外部组件,使用 PICO 板上集成的最大功... 发表于 05-18 17:41 • 10390次 阅读 【开源分享】树莓PICO掌上电脑的通用Python教程 爬虫进阶之提高爬虫效率的方式 相信来看这篇深造爬虫文章的同学,大部分已经对爬虫有不错的了解了,也在之前已经写过不少爬虫了,但我猜爬取的数据量都较小,因... 发表于 05-17 16:43 • 4828次 阅读 安装DevEco device tool打开VS找不到主页面的解决办法 本来发个贴,后来把标题的时候看到别人发的贴的经验贴推荐了,就解决了,所以我也来分分看一下。 原因:Python环境不玩。 解决... 发表于 05-13 10:22 • 467次 阅读 RK3399Pro上的Python api与RKNN C api推理速度一样吗 看了RK3399Pro的相关文档,感觉有两套API:一套是Toolkit的Python api,另一个是RKNN C api。这个理解对吗?另外想... 发表于 05-09 15:33 • 3439次 阅读 水滴摄影是如何实现的? 水滴摄影 摄影是一门通过探索和学习来灌输的艺术。数百次点击就能捕捉到一张完美的照片,摄影师脸上的满足感在眨眼之间就... 发表于 05-01 16:25 • 3669次 阅读 水滴摄影是如何实现的? Sipeed M2DOCK:全志V831 开源 人工智能 神经网络 视觉 AI Python开发板 作者@Sipeed 原文链接: 发表于 04-29 15:06 • 2546次 阅读 RKNN Toolkit Lite的使用与安装过程 RKNN Toolkit Lite 是 RKNN Toolkit 的精简版本,为用户提供在 PC、RK3399Pro、RK1808、RK1806、V1109、R... 发表于 04-27 18:36 • 3647次 阅读 python简单的获取基金信息 最近基金非常涨跌幅度蛮大的,很多原本不投资、不理财人,也开始讨论、参与买基金了。投资基金的人都知道根据投资对象的不同,... 发表于 04-27 16:43 • 6024次 阅读


【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3